Partitioning (unstructured)
Facade partition
データソースごとのpartition_fooも用意されている
partition_image
pip install 'unstructured[image]'
PDFと画像は同じロジック(partition_pdf_or_image)で処理しているようで、PDFの依存がインストールされる
引数はocr_languages(廃止)に代えてlanguagesを使う
"\n\n".join([str(el) for el in elements]